在做數據分析或專案研究時,我們常常需要收集使用者對應用程式的評價。例如,如果想研究電商平台的用戶反饋,我們就可以從 App Store 或 Google Play 的評論區著手。本文將一步步介紹如何收集這些資料,並說明常見的工具與注意事項。
以「PChome 24h購物」為例,打開 App Store 或 Google Play,搜尋應用程式後進入詳細頁面。這裡可以看到應用的基本資訊,包括:
這些就是我們爬取的主要資料欄位。
在開始寫爬蟲之前,建議先觀察目標頁面,確認有哪些欄位能夠被擷取。你可以參考官方文件或套件的說明,快速知道哪些資料能拿到,避免白白花時間去找不存在的欄位。
一般在做網站爬蟲時,常會聽到 Selenium 或 Beautiful Soup。
不過,對於 App Store 和 Google Play 這種應用商店頁面,其實已有 現成套件 可以使用(例如 google-play-scraper
或 app-store-scraper
),省去自己檢查 HTML 元素位置的麻煩。
備註:目前 app-store-scraper 已經無法使用,會爬取 HTML 的方式進行。
在開始動手爬之前,可以先確認以下事項:
透過正確的套件與流程,我們可以快速從 App Store 或 Google Play 收集應用程式的評論資料,進一步做情感分析、趨勢觀察或市場研究。
下一篇文章,我會分享實際的 Python 程式碼範例,讓你可以直接開始爬取資料 🚀